查看原文
其他

Cell Systems︱徐书华团队完成土家族单亲源基因序列从头组装并论证族群特异性参考基因组构建的必要性和应用价值

楼海一 岚翰生命科学 2023-03-10


撰文︱楼海一

责编︱王思珍 


基因组中蕴含的遗传密码决定了物种及个体间的差异,是表型世代传承和生物演化的根源。国际人类基因组计划(Human Genome Project)在2003年完成了第一个人类基因组,并长期以来作为通用的人类参考基因组(reference genome)广泛应用在生物学与医学研究中。目前通用的人类参考基因组(GRCh38)是由20个志愿者的DNA序列拼凑而成,其中欧裔族源成分约占57%、非裔占37%、亚裔占6%[1]。如此低的亚裔族源比例无法全面地代表亚洲人群的基因组结构和遗传多样性。长读长测序技术(long-read sequencing)的发展为从头组装(de novo assemble)高质量的参考基因组提供了技术支持,为数不多的几个亚洲人群基因组的从头组装体de novo assembly)已公开,包括汉族NH1[2]和HX1[3]、日本人JG1[4]、韩国人AK1[5]以及研究团队此前与国内合作者共同发布的藏族ZF1[6]等。这些组装体为生物学研究提供了东亚人群基因组的参考资源然而,关于族群参考基因组构建的价值和必要性仍然存在较多争议,其中更有不少理论和技术问题尚未得到解决。举例来说:在我国是否各民族都有必要构建参考基因组,抑或可借用既有的汉族参考基因组作替代?少数族群的参考基因组对遗传学以及更广泛的生物医学研究的价值究竟有多大?如何构建以及如何充分发挥这些族群特异参考基因组的优势?

 

2022年2月17日, 复旦大学生命科学学院的徐书华教授团队在Cell Systems上发表了题为“Haplotype-resolved de novo assembly of a Tujia genome suggests the necessity for high-quality population-specific genome references”的研究论文。研究团队利用长读长等新一代测序技术,从头组装了一个高质量的土家族基因组(TJ1);通过系统性数据分析和评估论证了构建族群特异的(population-specific)参考基因组的必要性和应用价值。



围绕上述族群参考基因组必要性的问题,研究团队利用了多种技术测定并组装了一个高质量可区分亲源染色体的参考基因组(TJ1)。之所以选取TJ1作为研究目标,是因为土家族是遗传关系上最接近汉族的少数民族(图1A),该研究背后的逻辑是:如果土家族特异的参考基因组的构建都具有充分的价值,则说明其他与汉族遗传关系更远缘的少数民族更有必要构建自身的参考基因组。利用TJ1已经解析单亲源的两套染色体(TJ1.p0与TJ1.p1)及已公开的其它基因组资源(GRCh38、NH1、ZF1等)(图1B),研究团队系统评估了族群特异性参考基因组在遗传变异检测、群体遗传分析以及医学应用中的影响与作用。


图1 利用TJ1组装体评估参考基因组在遗传学与医学研究中应用的必要性

(图源:Lou, H. et al., Cell Systems, 2022)

 

遗传变异检测方面,TJ1相较其它参考基因组能显著提升土家样本短读长测序(short read sequencing)的比对质量;更准确更灵敏地检测出单核苷酸变异(single nucleotide variation)(图1C)与基因组结构变异(structural variation),尤其是对后者的提升最为明显,并在单亲源序列解析中作出更精准的推断。研究团队同时也提出了族群特异性参考基因组的“最佳实践”分析流程(best practice),基于族群特异性参考基因组构建泛基因组图(pan-genome graph)是其中重要一环,最终支撑遗传变异检测及深度分析和应用。

 

群体遗传学分析方面,TJ1能更好地代表土家样本中优势等位基因(major allele),更精细地体现土家与汉族之前的遗传差异,从而为全基因组关联分析与法医学等领域提供更有信息量的祖源信息位点(ancestry informative marker)此外,族群特异性基因组有助于自然选择的检测,比如研究中发现了在乳糖耐受相关的基因LCT以及与HBV相关的基因UBXN8上的遗传变异可能在土家族中受到自然选择,而这些信号无法通过使用通用的参考基因组检测到(图1D)。

 

医学应用方面,TJ1能更灵敏和广谱地捕获医学相关基因上的罕见或低频遗传变异(图1E);实际上,待测群体和参考基因组的遗传关系与遗传变异的检测准确性和灵敏度呈正相关。此外,研究团队还发现族群特异性参考基因组能减少遗传诊断的假阳性从而避免误诊。

 

文章结论与讨论,启发与展望
综上所述,相比于通用的参考基因组,族群特异性参考基因组能够显著提升遗传变异检测的准确度与灵敏性,更高效地揭示群体间的遗传结构与遗传差异,更全面地判别医学疾病相关的低频罕见变异,更精准地辅助遗传诊断。同时,研究团队也指出,不仅族群的遗传背景在参考基因组的构建与应用中是关键因素,而且族群组装体的测序组装质量也非常重要:低质量的族群参考基因组在实际应用中存在误判风险,其表现甚至可能不及通用的人类参考基因组的效果。因此,该研究支持和呼吁构建高质量的族群参考基因组。


原文链接:https://www.cell.com/cell-systems/fulltext/S2405-4712(22)00041-2


复旦大学徐书华团队青年研究员楼海一博士、中国科学院上海营养与健康研究所博士生高扬谢波王亦民作为共同第一作者,楼海一博士与徐书华教授为该文共同通讯作者。该项工作得到了国家自然科学基金委、人类表型组上海市市级重大专项、中国科学院、英国皇家学会牛顿基金、国家重点研发计划、上海市科委等多项基金的资助,同时得到贝瑞基因公司的技术支持。


第一作者并通讯作者楼海一(左一);第一作者高扬(左二)、谢波(中)、王亦民(右二);通讯作者徐书华(右一)

(照片提供自:徐书华团队)


往期文章精选

【1】Nat Commun︱一种具有生物质转化潜力的α/β水解酶——葡萄糖醛酸酯酶的作用机理及与生物量的关系

【2】Nat Metab︱杨巍维/姚烽/赵允团队合作发现肿瘤免疫逃逸的新机制

【3】Cell Death Differ︱尹海芳团队揭示杜兴肌肉萎缩症新作用机制:转录因子Wt1激活心外膜细胞分化促进心肌纤维化

【4】PNAS︱全基因组关联分析揭示基因与领导职位和健康之间的关系

【5】Nat Commun︱朱涛团队报道乳腺癌肿瘤干细胞调控铁死亡及转移的克隆化增殖新机制

【6】Nat Commun︱首次!朱健康课题组创造无DNA甲基化的植物

【7】BMC Biology︱徐伟/刘爱忠揭示DNA甲基化谷在种子特异基因表达方面的作用机理

【8】Nat Commun︱周小明/孙子宜团队根据Sigma-1受体开放式构象揭示其配体进入途径的分子机制

【9】Cell Death Differ︱龙建纲/刘健康/张令强合作报道前列腺特异性癌基因OTUD6A促进前列腺癌发生机制

【10】Nat Methods︱费鹏/张玉慧课题组合作报道活细胞超分辨成像研究的新进展

【11】Current Biology︱孔凡江/刘宝辉揭示SOC1同源基因的进化与变异提高大豆产量

【12】PNAS︱ 新发现!一种调节脑内神经元发育和促炎反应的小胶质细胞亚型

【13】Nature︱心房颤动和心律失常的新机制! 心脏降钙素所介导的旁分泌信号转导如何控制心房纤维形成和心律失常


参考文献(上下滑动查看)  


1.Sherman RM, Salzberg SL: Pan-genomics in the human genome era. Nature Reviews Genetics 2020, 21:243-254.

2.Du ZL, Ma L, Qu HZ, Chen W, Zhang B, Lu X, Zhai WB, Sheng X, Sun YQ, Li WJ, et al: Whole Genome Analyses of Chinese Population and De Novo Assembly of A Northern Han Genome. Genomics Proteomics & Bioinformatics 2019, 17:229-247.

3.Shi L, Guo Y, Dong C, Huddleston J, Yang H, Han X, Fu A, Li Q, Li N, Gong S, et al: Long-read sequencing and de novo assembly of a Chinese genome. Nat Commun 2016, 7:12065.

4.Takayama J, Tadaka S, Yano K, Katsuoka F, Gocho C, Funayama T, Makino S, Okamura Y, Kikuchi A, Sugimoto S, et al: Construction and integration of three de novo Japanese human genome assemblies toward a population-specific reference. Nat Commun 2021, 12:226.

5.Seo JS, Rhie A, Kim J, Lee S, Sohn MH, Kim CU, Hastie A, Cao H, Yun JY, Kim J, et al: De novo assembly and phasing of a Korean human genome. Nature 2016, 538:243-247.

6.Ouzhuluobu, He YX, Lou HY, Cui CY, Deng L, Gao Y, Zheng WS, Guo YB, Wang XJ, Ning ZL, et al: De novo assembly of a Tibetan genome and identification of novel structural variants associated with high-altitude adaptation. National Science Review 2020, 7:391-402.


制版︱王思珍


本文完

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存